Análisis longitudinal a partir los medios de prensa on-line (2000 – 2024).
Observatorio de Violencia y Legitimidad Social (OLES)
2025-05-25
Matías Deneken
OLES & Pontificia Universidad Católica de Chile
Matías Gomez
OLES, Pontificia Universidad Católica de Chile y Universidad Central de Chile
Ismael Puga
OLES y Universidad Central de Chile
Los medios de comunicación desempeñan un papel crucial en la construcción de legitimidad y percepción pública sobre las acciones de las policías.
Tendencias de noticias sobre carabineros en Chile (2000 - 2023).
¿Cómo ha evolucionado la cobertura hacia Carabineros de Chile a lo largo del tiempo?
Fuente de datos:
Portal de noticias EMOL.com
Portal de noticias El Mercurio Online (EMOL) entre junio del año 200 hasta diciembre del año 2023.
Técnica de Webscrapping que permite extraer información de manera automatizada y masiva de la información disponible en sitios web. Se utilizó el software R para llevar a cabo del proceso. Se obtuvo un total de 1.052.167 observaciones de las cuáles 51.533 incluyen mención a carabineros (5%).
Codificación automática: diccionario léxico
En base a la información textual podemos identificar si una noticia se encuentra o no asociada un término en particular (forma deducativa de codificación) siempre y cuándo se encuentre asociada con la palabra de carabineros.
| Tema | Términos claves | Sujetos asociados |
|---|---|---|
| Delitos y crímenes comunes | Asalto, robo, hurto, narcotráfico, homicidio, femicidio […] | Ladrón, delincuente, homicida, agresor […] |
| Protestas y movilizaciones | Disturbios, protestas, manifestaciones, estallido social, movimiento estudiantil […] | Manifestantes, estudiantes, feministas, líderes sociales […] |
| Asuntos étnicos-territoriales | Conflicto indígena, macrozona sur, zona roja […] | Mapuche, comuneros, lonko, pueblos originarios |
Ello nos permitirá evidenciar las tendencias de temáticas y su relación con Carabineros a lo largo del tiempo.
Procesamiento de Lenguaje Natural (NLP) no supervisado mediante la técnica de Topic Model en su versión de Latent Dirichlet Allocation (LDA). LDA funciona asignando tópicos probables a cada palabra, basándose en dos ideas:
Cada documento está formado por una mezcla de temas (por ejemplo: seguridad, manifestaciones, conflicto indígena).
Cada tema está formado por un conjunto característico de palabras (por ejemplo: delincuencia, robo, ladrón para seguridad).
El algoritmo aprende patrones de co-ocurrencia de palabras para estimar estas combinaciones: Intentamos descubrir los temas ocultos que hay en un conjunto de texto.
Se usa una fórmula de probabilidad: \[ P(z = k \mid w, d) \propto \frac{n_{w|k} + \beta}{n_k + V\beta} \cdot \frac{n_{k|d} + \alpha}{n_d + K\alpha} \]
| Tópico | Términos clave |
|---|---|
| Accidentes | accidente, vehículo, carabineros, conductor, bus |
| Alto riesgo | carabineros, personal, allanamiento, droga, sector |
| Asistencia en catástrofes | región, valparaíso, zona, emergencia, incendio |
| Conflicto Mapuche | carabineros, región, araucanía, zona, ataque |
| Delincuencia | robo, sujetos, seguridad, delincuentes, comuna |
| Derechos Humanos | carabineros, institución, director, derechos, humanos |
| Drogas | carabineros, detención, detenidos, armas, control |
| Enfrentamientos balas | hospital, carabineros, arma, víctima, disparos |
| Judiciales | fiscal, fiscalía, investigación, ministerio, caso |
| Protestas | carabineros, estudiantes, marcha, incidentes, plaza |
| Proyectos seguridad | gobierno, presidente, interior, seguridad, sistema |
| Violencia en los Estadios | colo, estadio, chile, partido, universidad |
San Francisco - LASA Conference (2025)